TaggedPdfReaderTool.java example

Explorer

Assignments-master
- Ban A. Bogdan Marian
  - Bank
    - src
  - Dictionary
    - src
      - controller
        IWord.java
        Main.java
        NewWordObserver.java
        SimpleHashMap.java
        SimpleMap.java
        TableModel.java
        WordFactory.java
      - model
        ActualWord.java
        NullWord.java
      - ui
        MainPanel.java
        Window.java
  - OrderManagement
    - src
      - app
        Main.java
        data
        OPDept.java
        Warehouse.java
        graphic
        AdminPanel.java
        CustomerPanel.java
        LoginController.java
        UserType.java
        model
        Customer.java
        Order.java
        Product.java
        tree
        BST.java
        Node.java
        OrderNode.java
        ProductNode.java
  - Polynoms
    - src
      - graphic
        Application.java
        MainPanel.java
      - listeners
        OperationListener.java
        ReadKeyListener.java
      - polynomials
        Main.java
        Polynom.java
  - Queues
    - src
      - model
        Client.java
      - queues
        Main.java
        Simulation.java
        SimulationInput.java
        SimulationQueue.java
        Util.java
      - ui
        Window.java
- Berekmeri S. Lorand
  - BankAccount
    - src
      - main
        Bank.java
        BankProc.java
        Main.java
        SavingAccount.java
        SpendingAccount.java
      - model
        Account.java
        Person.java
      - ui
        GUI.java
  - Homework1
    - src
      - Main
        GUI.java
        Polynomial.java
      - Monomials
        Monom.java
        MonomFloat.java
        MonomInteger.java
  - Homework2_Warehouse1
    - src
      - Project
        AdminGUI.java
        BST.java
        BSTNode.java
        Customer.java
        IOClass.java
        Interface.java
        InterfaceProducts.java
        Main.java
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
  - Homework3_Queue
    - src
      - Main
        Algorithm.java
        Client.java
        GUI.java
        MainClass.java
        Queue.java
  - Tema5
    - src
      - main
        Main.java
      - model
        Dictionary.java
        DictionaryProc.java
      - ui
        GUI.java
- Bologa M. Marius - Vasile
  - PolinomC
    - src
      - controllers
        Controller.java
        MainController.java
        ManageOperations.java
      - models
        Coefficient.java
        IntegerCoefficient.java
        Operation.java
        Polynomial.java
        RealCoefficient.java
        TypeOfCoefficient.java
      - utilities
        PolynomFactory.java
        Utilities.java
      - view
        View.java
  - Tema2
    - src
      - controllers
        AdminFrameController.java
        SerializableManager.java
        UserFrameController.java
      - models
        Customer.java
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
        comparators
        OrderComparator.java
        ProductComparator.java
      - views
        AdminFrame2.java
        LoginFrame.java
        MessageDialogs.java
        UserFrame.java
  - Tema3Final
    - src
      - controllers
        Main.java
        MainFrameController.java
      - models
        Server.java
        Task.java
        TaskGenerator.java
        TaskScheduler.java
        Utilities.java
      - views
        MainFrame.java
        SimulationPanel.java
  - Tema4
    - src
      - controllers
        AdminFrameController.java
        MainController.java
        SerializableManager.java
        UserFrameController.java
      - junit
        TestUnitForBank.java
      - models
        Account.java
        BancProc.java
        Bank.java
        Person.java
        SavingAccount.java
        SpendingAccount.java
        utilities
        AdminReports.java
        UserReport.java
        Utilities.java
      - views
        AdminFrame.java
        LoginFrame.java
        MessageDialogs.java
        UserFrame.java
  - Tema5
    - src
      - controllers
        DictionaryFrameController.java
        JSONParser.java
        Main.java
      - models
        Container.java
        Dictionary.java
        DictionaryInterface.java
        Iterator.java
      - views
        DictionaryFrame.java
        MessageDialogs.java
- Drimbarean I. Maria Cristina
  - MyDictionary
    - src
      - pt
        MyDictionary
        MVC
        DataAcess.java
        Interface.java
        SerializeDictionary.java
        model
        Dictionary.java
        DictionaryInterface.java
        WildcardMatch.java
        Word.java
        strategy
        Add.java
        Operation.java
        Remove.java
        tests
        JsonTest.java
        Test.java
        TestWildcard.java
  - ObserverBank
    - src
      - pt
        ObserverBank
        basicObjects
        Account.java
        AccountType.java
        Bank.java
        BankProc.java
        Person.java
        SavingAccount.java
        SpendingAccount.java
        gui
        AdminView.java
        ClientView.java
        SerializeBank.java
        StartWindow.java
        tests
        TestBank.java
  - OnlineShop
    - src
      - pt
        onlineShop
        gui
        AdminLogin.java
        AdminView.java
        CostumerLogin.java
        CostumerView.java
        CostumerView2.java
        OrderHistory.java
        StartLogin.java
        Stock.java
        models
        Administrator.java
        Costumer.java
        Order.java
        Product.java
        TestClass.java
        Warehouse.java
        processing
        Main.java
        OPDept.java
        SerializeObjects.java
  - Polinomials
    - src
      - pt
        polynomials
        controllers
        Main.java
        PolynomialDivide.java
        PolynomialOperations.java
        models
        AbstractMonom.java
        DoubleMonom.java
        IntegerMonom.java
        Polynomial.java
        views
        Board.java
        StartWindow.java
  - ProcessingQueues
    - src
      - pt
        processingQueues
        principal
        Client.java
        ClientGenerator.java
        PeakHour.java
        Scheduler.java
        SupermarketCheckout.java
        simulation
        InputWindow.java
        Main.java
        Simulation.java
        TestQueue.java
        TestScheduler.java
- Farcas S
  - HW1
    - src
  - HW2
    - src
  - HW3
    - src
      - controllers
        Main.java
        MainViewController.java
      - models
        Operations.java
        Server.java
        Task.java
        TaskGenerator.java
        TaskScheduler.java
      - views
        MainView.java
        QueueEvolution.java
  - HW4
    - src
  - HW5
    - src
      - controllers
        Main.java
        MainFrameController.java
        PopulateController.java
      - models
        Dictionary.java
        DictionaryEntry.java
        DictionaryProc.java
        IllegalOperationException.java
        Phrase.java
        Word.java
      - views
        MainFrame.java
        PopulateFrame.java
- Florea I. Razvan
  - HW1Polynomials
    - src
      - Control
        Functionality.java
        Operations.java
        RunApp.java
        UserDialog.java
      - Model
        Polynomial.java
      - UserInterface
        CustomizedButton.java
        Fonts.java
        OperationsPanel.java
        OutputFrame.java
        UserFrame.java
  - HW2OrdersManagement
    - src
      - Control
        AdminActions.java
        CustomerActions.java
        Helper.java
        RunApp.java
        UserDialog.java
      - Orders
        OPDept.java
        Order.java
        OrdersTable.java
      - Stock
        Product.java
        ProductsTable.java
        Warehouse.java
      - UserInterface
        AdminFrame.java
        CustomerFrame.java
        CustomizedButton.java
        OutputFrame.java
      - Users
        Admin.java
        Customer.java
        CustomersTable.java
        User.java
        UsersData.java
  - HW3TaskHandling
    - src
      - Control
        DisplayControl.java
        RunApp.java
        TaskGenerator.java
        TaskScheduler.java
      - Entities
        Server.java
        Task.java
      - Helper
        AtomicOperations.java
        CheckerClass.java
        TimeConverter.java
      - View
        CommandPanel.java
        CustomizedFrame.java
        OutputPanel.java
  - HW4TheBank
    - src
      - AccountEntities
        Account.java
        SavingAccount.java
        SpendingAccount.java
      - BankEntity
        AllDataTable.java
        Bank.java
        BankProc.java
        SpecificClientTable.java
      - Control
        Actions.java
        Login.java
        RunBank.java
      - GraphicUserInterface
        AdminFrame.java
        ClientFrame.java
        OutputFrame.java
      - UserEntities
        Administrator.java
        Person.java
        User.java
      - Utilities
        Helper.java
  - HW5Dictionary
    - src
      - Control
        Helper.java
        RunDictionary.java
      - DictionaryEntities
        Dictionary.java
        DictionaryFunctions.java
      - UserInterface
        ControlFrame.java
        CustomizedFrame.java
        OutputArea.java
        OutputFrame.java
- Ghiurutan V. Alexandru
- Haba N. Tudor Alexandru
  - Assignment 1
    - Assignment 1
      - src
        assignment1
        GUI.java
        Main.java
        PolynomialOperation.java
  - Assignment 2
    - website
      - src
        website
        AdminOp.java
        Authentificate.java
        Customer.java
        CustomerOp.java
        Main.java
        OPDepartment.java
        Order.java
        Product.java
        UserGUI.java
        Warehouse.java
  - Assignment 2.1
    - website
      - src
        website
        AdminOp.java
        Authentificate.java
        Customer.java
        CustomerOp.java
        Main.java
        OPDepartment.java
        Order.java
        Product.java
        UserGUI.java
        Warehouse.java
- Lupea V. Dariana
  - Bank_HW4
    - src
      - Controller
        Main.java
      - Entities
        Account.java
        Bank.java
        BankInterface.java
        Person.java
        SavingAccount.java
        SpendingAccount.java
      - GUI
        Frame.java
      - Helper
        Serialization.java
        UserInputChecker.java
      - TestDriver
        TestUnit.java
  - OrderManagement
    - src
      - Comparators
        OrderComparator.java
        ProductComparator.java
      - Controller
        MainController.java
      - Model
        Admin.java
        Customer.java
        OPD.java
        Order.java
        Product.java
        User.java
        Warehouse.java
      - Serializing
        ReadFileS.java
        WriteFileS.java
      - View
        AdminWindow.java
        CustomerWindow.java
        FirstWindow.java
        ShopWindow.java
        StockWindow.java
  - Polynomials
    - src
      - GUI
        MainWindow.java
      - Model
        Operations.java
        Polynomial.java
        Useful.java
      - View
        Main.java
  - Simulation
    - src
      - GUI
        SimulationFrame.java
      - Model
        Server.java
        Task.java
        TaskGenerator.java
        TaskScheduler.java
        Test.java
  - Thesaurus
    - src
      - Controller
        Driver.java
      - Entities
        LongWord.java
        ShortWord.java
        Synonym.java
        SynonymInterface.java
        Word.java
        WordFactory.java
        WordObserver.java
      - GUI
        Frame.java
      - Helper
        UserInputChecker.java
- Mihoc V. Nicolae
  - Homework I
    - src
      - Polynomials
        ControlPanel.java
        Main.java
        Polynomial.java
  - Homework II
    - src
      - Comparators
        OrderCompare.java
        ProductCompare.java
      - Design
        Administrator.java
        Customer.java
        Main.java
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
      - Frames
        AdminPanel.java
        LogInFrame.java
        UserPanel.java
      - Read_Write
        InputOutput.java
  - Homework III
    - QueueSimulator
      - src
        Controller
        Main.java
        Queue
        Checkout.java
        Customer.java
        CustomerGenerator.java
        Scheduler.java
        View
        GUI.java
  - Homework IV
    - BankApplication
      - src
        Bank
        Bank.java
        BankProc.java
        MainController
        Main.java
        Management
        Account.java
        HashTable.java
        Person.java
        SavingAccount.java
        SpendingAccount.java
        TestUnit
        JUnitTest.java
        View
        FilteredTableModel.java
        GUI.java
  - Homework V
    - Dictionary
      - src
        Dictionary
        Dictionary.java
        DictionaryInterface.java
        exception
        AddWordException.java
        DefineException.java
        RemoveWordException.java
        gui
        Controller.java
        Gui.java
        Main.java
- Nistor A. Rares Constantin
  - Bank
    - src
      - account
        Account.java
        SavingAccount.java
        SpendingAccount.java
      - bank
        Bank.java
        BankProc.java
      - gui
        GUI.java
      - tes
        Test.java
      - user
        Person.java
  - OrderManagement
    - src
      - project
        Admin.java
        Customer.java
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
      - userInterface
        Gui.java
  - Poly
    - src
      - Test
        Main.java
      - gui
        GUI.java
      - program
        HelpfulFunctions.java
        Operations.java
        Polynomial.java
  - q
    - src
      - q
        Queue.java
        Server.java
        Simulator.java
        Task.java
- Pascaru S. Cosmina Roxana
  - Bank Assignment 4
    - Bank2
      - src
        main
        LoginFrame.java
        MainClass.java
        models
        Account.java
        Bank.java
        BankProc.java
        Person.java
        SavingsAccount.java
        SpendingsAccount.java
        panels
        AdminPanel.java
        CustomerPanel.java
        tables
        ClientsTable.java
        ClientsTableModel.java
        InfoTable.java
        InfoTableModel.java
        test
        TestBank1.java
  - Dictionary Assignment 5
    - SynonimsDictionary
      - src
        controller
        Controller.java
        main
        MainClass.java
        models
        Dictionary.java
        DictionaryInterface.java
        view
        View.java
  - Order Management Assignment 2
    - OM
      - src
        groups
        OPDept.java
        ShopCustomers.java
        Warehouse.java
        main
        Filter.java
        Gui.java
        MainClass.java
        panels
        AdminPanel.java
        CustomerPanel.java
        LogInPanel.java
        OrderPanel.java
        subjects
        Admin.java
        Customer.java
        Order.java
        Person.java
        Product.java
        ProductStock.java
        tables
        CustomersTable.java
        CustomersTableModel.java
        OrdersTable.java
        OrdersTableModel.java
        StockTableModel.java
        WarehouseTable.java
  - Polynomials Assignment 1
    - polynomials
      - src
        main
        GUI.java
        PolyMain.java
        Tokens.java
        operations
        BiOperation.java
        MonoOperation.java
        Operation.java
        polynomials
        Monom.java
        Polynomial.java
  - Queues Assignment 3
    - ThreadsAss3
      - src
        main
        MainClass.java
        StartGui.java
        ThreadsGui.java
        scheduler
        Client.java
        Scheduler.java
        shop
        Counter.java
        Shop.java
  - SynonimsDictionary
    - src
      - controller
        Controller.java
      - main
        MainClass.java
      - models
        Dictionary.java
        DictionaryInterface.java
      - view
        View.java
  - ThreadsAss3
    - src
      - pack
        Client.java
        Counter.java
        Gui.java
        MainClass.java
        Scheduler.java
        Shop.java
- Pomian G. Gheorghe Aurelian
  - HW1
    - polynom
      - src
        GUI
        GUI.java
        helpers
        Operations.java
        main
        IntegerP.java
        Polynom.java
        RealP.java
  - HW2
    - P2
      - src
        Helpers
        Account.java
        BST.java
        FileHelp.java
        StateManager.java
        Item
        Order.java
        Product.java
        UI
        Admin.java
        CreateNew.java
        Customer.java
        History.java
        MainMenu.java
        data
        Accounts.java
        Library.java
        OPDept.java
        Warehouse.java
- Popa T. Florin
  - Assignment_1
    - src
      - Polynoms
        App.java
        GUI.java
        Operations.java
  - Assignment_2
    - src
  - Assignment_3
    - src
      - Application
        Checkout.java
        Client.java
        Main.java
        Simulate.java
  - Assignment_4
    - src
      - Controllers
        App.java
        TestingClass.java
      - models
        Account.java
        Bank.java
        BankProc.java
        GUI.java
        Person.java
        SavingAccount.java
        SpendingAccount.java
      - panels
        Panel1.java
        Panel2.java
        Panel3.java
- Popescu P. Diana Gabriela
  - BankAssign4
    - src
  - DictionaryAssign5
    - src
      - Test.java
      - controller
        App.java
        Controller.java
        Main.java
      - models
        Dictionary.java
        DictionaryProc.java
        ProxyDictionary.java
      - view
        DictionaryFrame.java
  - OrderManagement
    - src
      - order
        management
        IO
        AdminFrame.java
        CustomerFrame.java
        GenericFrame.java
        LogInFrame.java
        main
        App.java
        Controller.java
        Main.java
        models
        ComparatorOrder.java
        ComparatorProduct.java
        Customer.java
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
  - PolynomialsProcessing
    - src
      - poly
        IO
        ConsolePrinter.java
        DegreeFrame.java
        ProcessingFrame.java
        model
        Coefficient.java
        IntCoeff.java
        Polynomial.java
        RealCoeff.java
        operations
        Functions.java
        processing
        App.java
        Controller.java
        Main.java
  - threadsAssign3
    - src
      - threadsAssign3
        EventsLog.java
        Scheduler.java
        Server.java
        Simulator.java
        SimulatorFrame.java
        Task.java
- Somfelean R. Iulia Maria
  - Homework1_Poly
    - src
      - controller
        PolyController.java
      - main
        Main.java
      - model
        IntPolynomial.java
        Monomial.java
        NotAPolynomialException.java
        PolyOps.java
        Polynomial.java
        RealPolynomial.java
      - view
        MenuWithOperationsGUI.java
  - Homework2_OrderManagement
    - src
      - comparators
        OrderComparator.java
        OrderedProductComparator.java
        ProductComparator.java
      - controllers
        AdminController.java
        LoginController.java
        SerializationController.java
        UserController.java
      - model
        Customer.java
        OPDept.java
        Order.java
        OrderedProduct.java
        Product.java
        Warehouse.java
      - utilities
        Constants.java
        Main.java
        OrderStatus.java
        ProductStatus.java
        UserType.java
      - view
        AdminView.java
        LogInView.java
        UserView.java
  - Homework3_Threads
    - src
      - controller
        Controller.java
      - model
        CashRegister.java
        Client.java
        ClientGenerator.java
        QueuesManager.java
      - utilities
        Constants.java
      - view
        LoggerPanel.java
        QueuePanel.java
        SimulationFrame.java
  - Homework5_SynonymsDictionary
    - src
      - controller
        App.java
        Controller.java
      - model
        DicInterface.java
        Dictionary.java
        IWord.java
        Word.java
        WordContext.java
        WordFactory.java
        WordTotal.java
      - view
        View.java
  - Homework_4_Bank
    - src
      - controllers
        BankController.java
        Main.java
        SerializationController.java
      - model
        Account.java
        Bank.java
        BankProc.java
        BankTest.java
        Person.java
        SavingAccount.java
        SpendingAccount.java
      - utilities
        AccountType.java
        Constants.java
        IllegalProcedureException.java
        InsufficientMoney.java
      - view
        BankView.java
        LoginView.java
- Stupariu D. Bogdan Florin
  - A1
    - Polynom
      - src
        gui
        GUI.java
        mathOperations
        Derive.java
        Difference.java
        Division.java
        IDOp.java
        Integral.java
        Multiplication.java
        Operation.java
        Sum.java
        polynom
        Polynom.java
        Term.java
        run
        Const.java
        Main.java
  - A2
    - Shop
      - src
        actors
        User.java
        logInUser.java
        gui_interface
        GUI.java
        createUser.java
        waitingWindow.java
        run
        Const.java
        Main.java
        shop
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
- Sutea D. Adrian
  - OrderManagement
    - src
      - gui
        AdminGui.java
        Gui.java
        RegularGui.java
      - order
        Customer.java
        Main.java
        OPDept.java
        Order.java
        Product.java
        Warehouse.java
  - Polynomials
    - src
      - gui
        Gui.java
      - poly
        Main.java
        Monomial.java
        Operations.java
        Polynomial.java
  - Queues
    - src
      - gui
        Gui.java
      - queues
        Client.java
        Generator.java
        Main.java
        Scheduler.java
        Server.java
- Tatar I. Mara
  - Dictionary
    - src
      - controller
        Main.java
      - models
        Dictionary.java
        DictionaryProc.java
      - view
        DictionaryFrame.java
  - HMK3
    - src
      - Controller
        Controller.java
      - models
        Scheduler.java
        Server.java
        Simulator.java
        Task.java
      - parameters
        Parameters.java
      - views
        SimulatorFrame.java
  - HMK4
    - src

/*
 * $Id: 7162beaa605fcf756f2a53c51578e7e7a2796e7c $
 *
 * This file is part of the iText (R) project.
 * Copyright (c) 1998-2016 iText Group NV
 * Authors: Bruno Lowagie, et al.
 *
 * This program is free software; you can redistribute it and/or modify
 * it under the terms of the GNU Affero General Public License version 3
 * as published by the Free Software Foundation with the addition of the
 * following permission added to Section 15 as permitted in Section 7(a):
 * FOR ANY PART OF THE COVERED WORK IN WHICH THE COPYRIGHT IS OWNED BY
 * ITEXT GROUP. ITEXT GROUP DISCLAIMS THE WARRANTY OF NON INFRINGEMENT
 * OF THIRD PARTY RIGHTS
 *
 * This program is distributed in the hope that it will be useful, but
 * WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
 * or FITNESS FOR A PARTICULAR PURPOSE.
 * See the GNU Affero General Public License for more details.
 * You should have received a copy of the GNU Affero General Public License
 * along with this program; if not, see http://www.gnu.org/licenses or write to
 * the Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor,
 * Boston, MA, 02110-1301 USA, or download the license from the following URL:
 * http://itextpdf.com/terms-of-use/
 *
 * The interactive user interfaces in modified source and object code versions
 * of this program must display Appropriate Legal Notices, as required under
 * Section 5 of the GNU Affero General Public License.
 *
 * In accordance with Section 7(b) of the GNU Affero General Public License,
 * a covered work must retain the producer line in every PDF that is created
 * or manipulated using iText.
 *
 * You can be released from the requirements of the license by purchasing
 * a commercial license. Buying such a license is mandatory as soon as you
 * develop commercial activities involving the iText software without
 * disclosing the source code of your own applications.
 * These activities include: offering paid services to customers as an ASP,
 * serving PDFs on the fly in a web application, shipping iText with a closed
 * source product.
 *
 * For more information, please contact iText Software Corp. at this
 * address: sales@itextpdf.com
 */
package com.itextpdf.text.pdf.parser;

import com.itextpdf.text.error_messages.MessageLocalization;
import com.itextpdf.text.pdf.*;
import com.itextpdf.text.xml.XMLUtil;

import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import java.util.Set;

/**
 * Converts a tagged PDF document into an XML file.
 * 
 * @since 5.0.2
 */
public class TaggedPdfReaderTool {

	/** The reader object from which the content streams are read. */
	protected PdfReader reader;
	/** The writer object to which the XML will be written */
	protected PrintWriter out;

	/**
	 * Parses a string with structured content.
	 * 
	 * @param reader
	 *            the PdfReader that has access to the PDF file
	 * @param os
	 *            the OutputStream to which the resulting xml will be written
	 * @param charset
	 *            the charset to encode the data
     * @since 5.0.5
	 */
	public void convertToXml(PdfReader reader, OutputStream os, String charset)
			throws IOException {
		this.reader = reader;
        OutputStreamWriter outs = new OutputStreamWriter(os, charset);
		out = new PrintWriter(outs);
		// get the StructTreeRoot from the root object
		PdfDictionary catalog = reader.getCatalog();
		PdfDictionary struct = catalog.getAsDict(PdfName.STRUCTTREEROOT);
		if (struct == null)
			throw new IOException(MessageLocalization.getComposedMessage("no.structtreeroot.found"));
		// Inspect the child or children of the StructTreeRoot
		inspectChild(struct.getDirectObject(PdfName.K));
		out.flush();
		out.close();
	}

	/**
	 * Parses a string with structured content. The output is done using the
     * current charset.
	 *
	 * @param reader
	 *            the PdfReader that has access to the PDF file
	 * @param os
	 *            the OutputStream to which the resulting xml will be written
	 */
	public void convertToXml(PdfReader reader, OutputStream os)
			throws IOException {
        convertToXml(reader, os, "UTF-8");
    }

    /**
	 * Inspects a child of a structured element. This can be an array or a
	 * dictionary.
	 * 
	 * @param k
	 *            the child to inspect
	 * @throws IOException
	 */
	public void inspectChild(PdfObject k) throws IOException {
		if (k == null)
			return;
		if (k instanceof PdfArray)
			inspectChildArray((PdfArray) k);
		else if (k instanceof PdfDictionary)
			inspectChildDictionary((PdfDictionary) k);
	}

	/**
	 * If the child of a structured element is an array, we need to loop over
	 * the elements.
	 * 
	 * @param k
	 *            the child array to inspect
	 */
	public void inspectChildArray(PdfArray k) throws IOException {
		if (k == null)
			return;
		for (int i = 0; i < k.size(); i++) {
			inspectChild(k.getDirectObject(i));
		}
	}

    /**
     * If the child of a structured element is a dictionary, we inspect the
     * child; we may also draw a tag.
     *
     * @param k
     *            the child dictionary to inspect
     */
    public void inspectChildDictionary(PdfDictionary k) throws IOException {
        inspectChildDictionary(k, false);
    }


	/**
	 * If the child of a structured element is a dictionary, we inspect the
	 * child; we may also draw a tag.
	 * 
	 * @param k
	 *            the child dictionary to inspect
	 */
    public void inspectChildDictionary(PdfDictionary k, boolean inspectAttributes) throws IOException {
        if (k == null)
            return;
        PdfName s = k.getAsName(PdfName.S);
        if (s != null) {
            String tagN = PdfName.decodeName(s.toString());
            String tag = fixTagName(tagN);
            out.print("<");
            out.print(tag);
            if (inspectAttributes) {
                PdfDictionary a = k.getAsDict(PdfName.A);
                if (a != null) {
                    Set<PdfName> keys =  a.getKeys();
                    for (PdfName key : keys) {
                        out.print(' ');
                        PdfObject value = a.get(key);
                        value = PdfReader.getPdfObject(value);
                        out.print(xmlName(key));
                        out.print("=\"");
                        out.print(value.toString());
                        out.print("\"");
                    }
                }
            }
            out.print(">");
            PdfObject alt = k.get(PdfName.ALT);
            if (alt != null && alt.toString() != null) {
                out.print("<alt><![CDATA[");
                out.print(alt.toString().replaceAll("[\\000]*", ""));
                out.print("]]></alt>");
            }
            PdfDictionary dict = k.getAsDict(PdfName.PG);
            if (dict != null)
                parseTag(tagN, k.getDirectObject(PdfName.K), dict);
            inspectChild(k.getDirectObject(PdfName.K));
            out.print("</");
            out.print(tag);
            out.println(">");
        } else
            inspectChild(k.getDirectObject(PdfName.K));
    }

    protected String xmlName(PdfName name) {
        String xmlName = name.toString().replaceFirst("/", "");
        xmlName = Character.toLowerCase(xmlName.charAt(0))
                   + xmlName.substring(1);
        return xmlName;
    }

    private static String fixTagName(String tag) {
        StringBuilder sb = new StringBuilder();
        for (int k = 0; k < tag.length(); ++k) {
            char c = tag.charAt(k);
            boolean nameStart =
                c == ':'
                || (c >= 'A' && c <= 'Z')
                || c == '_'
                || (c >= 'a' && c <= 'z')
                || (c >= '\u00c0' && c <= '\u00d6')
                || (c >= '\u00d8' && c <= '\u00f6')
                || (c >= '\u00f8' && c <= '\u02ff')
                || (c >= '\u0370' && c <= '\u037d')
                || (c >= '\u037f' && c <= '\u1fff')
                || (c >= '\u200c' && c <= '\u200d')
                || (c >= '\u2070' && c <= '\u218f')
                || (c >= '\u2c00' && c <= '\u2fef')
                || (c >= '\u3001' && c <= '\ud7ff')
                || (c >= '\uf900' && c <= '\ufdcf')
                || (c >= '\ufdf0' && c <= '\ufffd');
            boolean nameMiddle =
                c == '-'
                || c == '.'
                || (c >= '0' && c <= '9')
                || c == '\u00b7'
                || (c >= '\u0300' && c <= '\u036f')
                || (c >= '\u203f' && c <= '\u2040')
                || nameStart;
            if (k == 0) {
                if (!nameStart)
                    c = '_';
            }
            else {
                if (!nameMiddle)
                    c = '-';
            }
            sb.append(c);
        }
        return sb.toString();
    }

	/**
	 * Searches for a tag in a page.
	 * 
	 * @param tag
	 *            the name of the tag
	 * @param object
	 *            an identifier to find the marked content
	 * @param page
	 *            a page dictionary
	 * @throws IOException
	 */
	public void parseTag(String tag, PdfObject object, PdfDictionary page)
			throws IOException {
		// if the identifier is a number, we can extract the content right away
		if (object instanceof PdfNumber) {
			PdfNumber mcid = (PdfNumber) object;
			RenderFilter filter = new MarkedContentRenderFilter(mcid.intValue());
			TextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
			FilteredTextRenderListener listener = new FilteredTextRenderListener(
					strategy, filter);
			PdfContentStreamProcessor processor = new PdfContentStreamProcessor(
					listener);
			processor.processContent(PdfReader.getPageContent(page), page
					.getAsDict(PdfName.RESOURCES));
			out.print(XMLUtil.escapeXML(listener.getResultantText(), true));
		}
		// if the identifier is an array, we call the parseTag method
		// recursively
		else if (object instanceof PdfArray) {
			PdfArray arr = (PdfArray) object;
			int n = arr.size();
			for (int i = 0; i < n; i++) {
				parseTag(tag, arr.getPdfObject(i), page);
				if (i < n - 1)
					out.println();
			}
		}
		// if the identifier is a dictionary, we get the resources from the
		// dictionary
		else if (object instanceof PdfDictionary) {
			PdfDictionary mcr = (PdfDictionary) object;
			parseTag(tag, mcr.getDirectObject(PdfName.MCID), mcr
					.getAsDict(PdfName.PG));
		}
	}

}